從外媒獲得消息,位于莫斯科的三星AI中心和Skolkovo科學(xué)技術(shù)研究所的研究人員發(fā)表了一篇新論文,詳細(xì)介紹了從單個(gè)靜止人像照片生成3D動(dòng)畫人像的創(chuàng)建。與此前能夠生成照片般逼真肖像的人工智能AI系統(tǒng)不同,這項(xiàng)新技術(shù)可以產(chǎn)生移動(dòng)的說話人像動(dòng)圖,雖然不是很完美,但卻非常逼真。

創(chuàng)建的過程解析
新發(fā)表的研究解釋說,“實(shí)際場景”要求系統(tǒng)只能使用少數(shù)甚至單個(gè)人進(jìn)行生成,而不是廣泛的圖像數(shù)據(jù)集。為了滿足這一要求,研究人員創(chuàng)建了一個(gè)系統(tǒng),盡管需要調(diào)整數(shù)以千萬計(jì)的參數(shù),但“訓(xùn)練可以僅基于少量圖像并快速完成”。
通過使用生成對抗網(wǎng)絡(luò),研究人員能夠制作除了圖像之外的彩繪肖像,還可以生成蒙娜麗莎的談話,移動(dòng)版本。正如詳細(xì)介紹該研究的視頻所示,最終結(jié)果在質(zhì)量和現(xiàn)實(shí)性方面各不相同,有些可能與真實(shí)視頻無法區(qū)分(至少在低分辨率下)。
實(shí)際效果展示的GIF圖
研究人員指出,這類系統(tǒng)還存在其他一些問題,包括靜止圖像中的人與用于動(dòng)畫肖像的說話人之間存在“顯著的個(gè)性不匹配”。研究人員解釋說,“如果有人想制作”假“木偶操作視頻而沒有這種不匹配,那么就需要進(jìn)行一些具有里程碑意義的改編。
該技術(shù)仍然可用于不一定需要個(gè)性匹配的目的,而是僅作為一小部分靜止圖像存在的角色的簡單動(dòng)畫。到目前為止,該技術(shù)僅適用于臉部和軀干的上半部分。目前尚不清楚研究人員是否計(jì)劃將系統(tǒng)擴(kuò)展到包括其他身體部位。
三星的研究加入了NVIDIA基于人工智能的肖像作品,以及非肖像AI圖像生成,包括今年早些時(shí)候推出的NVIDIA系統(tǒng)- 能夠?qū)⒑唵尾輬D快速轉(zhuǎn)換為復(fù)雜風(fēng)景圖像的系統(tǒng)。



